package com.sinaapp.gavinzhang.GSpider.core;

import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

import java.util.List;

/**
 * Created by gavin on 15-9-8.
 */
public interface PageProcessor {

    /**
     * 处理获取到的网页，同时传入webUrl以备使用
     * @param html
     * @return
     */
    public Elements preDispose(Document html);

    /**
     * 用户处理页面
     * @param html
     * @param webUrl
     */
    public abstract void dispose(Document html, String webUrl);

    /**
     * 得到用户额外添加的网址列表
     * @return
     */
    public List<String> getUrlList();
}
